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摘要 :【 目 的] 了 解 闪 峡 蝶 亚 科 属 间 及 种 间 的 分 子 系统 进化 关系 。[ 方 法 】 采 用 PCR ZEE ΝΕ ΣΑΕ ΙΕΚ Chitoria 
ulupi 线粒体 基因 组 全 序列 进行 了 测定 和 分 析 。 基 于 线粒体 基因 组 13 个 蛋白 质 编码 基因 的 核 苷 酸 序 列 构建 了 38 
种 鲜 落 目 昆虫 的 系统 发 育 树 。【 结果】 分 析 结 果 表 明 , 武 铠 峡 蝶 线粒体 基因 组 全 长 15 279 bp ,包括 13 个 蛋白 质 编码 
基因 22 个 tRNA 基因 2 个 rRNA 基因 和 一 段 长 度 为 391 bp B A ΕΤΗ $6 PC ,基因 排列 顺序 与 其 他 已 知 近 缘 种 昆虫 
相同 。 武 铠 峡 紧 线 粒 体 基 因 组 中 存在 很 高 的 A +T 含 量 (79.9% ) 13 个 和 蛋白 质 编码 基因 中 ,CON 以 TTG 作为 起 
始 密 码 子 ,COI 以 CCA 作为 起 始 密码 子 外 ,其余 均 为 昆虫 典型 的 起 始 密码 子 AIN。CO1 和 NDA 基因 使 用 了 不 完全 
终止 密码 子 T 了 ,其余 基 因 均 以 典型 的 ΤΑΑ 为 终止 密码 子 。 在 所 测 得 的 22 个 tRNA 基因 中 , 除 RNAS ΑΗ DHU 
辟 外 ,其 余 tRNA 均 能 形成 典型 的 三 叶 章 结构 。 与 其 他 多 数 鳞 霄 目 昆 虫 一 样 La Re BEBE Α ET ES DCHUR — Ex FH 
ATAGAA 引导 的 保守 的 多 聚 工 结构 ,长 度 为 21 bp, 并 散布 看 一 些 长 短 不 一 的 串联 重复 单元 。 系 统 发 育 树 结 果 显 
示 , 总 科 级 别 的 系统 发 育 关 系 为 : 卷 峨 总 科 + Ελα; + (ΜΕ ΜΕ ΡΕ +( 夜 蛾 总 科 + 在 蛾 总 科 + 尺 蛾 总 科 ) ) ) ;在 
峡 蝶 科 物 种 中 , 武 钳 峡 蝶 与 猫 峡 蝶 Timelaea maculate 亲缘 关系 最 近 。[【 结 论 】 基 于 分 子 标 记 构 建 的 鳞 翅 目 昆 虫 系统 
发 育 关 系 与 传统 的 形态 学 分 类 结果 基本 一 致 。 
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Sequencing and analysis of the complete mitochondrial genome of Chitoria 
ulupi ( Lepidoptera. Nymphalidae) 
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Abstract: [ Aim] To explore the intergeneric and interspecific molecular and evolutionary relationships of 
Apaturinae. [ Methods ] The complete mitochondrial genome of Chitoria ulupi was determined 
and analyzed by using polymerase chain reaction amplification and prime walking. Based on nucleotide 
sequences of 13 protein coding genes ( PCGs) , the phylogenetic tree of 38 lepidopteran species was 
constructed using maximum parsimony ( MP) method. [Results] The results indicated that the complete 
mitochondrial genome of C. ulupi is a circular molecule of 15 279 nucleotides, including 13 protein 
coding genes, 22 tRNA genes, 2 rRNA genes and a 391 bp A + T-rich region. The arrangement of 
genes in C. ulupi is consistent with the sequence of other closely related species. The mitochondrial 
genome of C. ulupi is biased toward a high A +T content (79.996 ). All protein coding genes start with 
a typical ATN initiation codon, except that the COI starts with. the CGA codon and the. COI begins 
with the TTG codon. Majority of the 13 PCGs in C. ulupi have a complete termination codon ( TAA or 
TAG), except for the COII and ND4 genes which have incomplete stop codons (T). All tRNAs show the 
classic clover-leaf structure, except that the dihydrouridine ( DHU) arm of tRNA ΟΡ forms a simple 
loop. The C. ulupi A + T-rich region contains some conserved structures including a structure combing 
the motif ATAGAA, 21 bp poly( T) stretch and a microsatellite ( AT), element, which is similar to those 
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found in the mitogenomes of other related species. The results of phylogenetic tree showed that the 


phylogenetic relationship at the superfamily level is Tortricoidea + ( Papilionoidea + ( Pyraloidea + 


( Noctuoidea + Bombycoidea + Geometroidea) ) ) , and within the Nymphalidae group, C. ulupi is closely 


related with Timelaea maculate. [ Conclusion] The phylogenetic relationship of lepidopteran species 


based on molecular markers is basically consistent with the results of the traditional morphological 


classification. 


Key words: Lepidoptera; Nymphalidae; Chitoria ulupi; mitochondrial genome; phylogeny 








动物 线粒体 基因 组 具有 相对 较 小 ( 约 为 15 ~ 19 
kb) .结构 人 简单、 母系 遗传 和 进化 速率 快 每 特点 ( 鞭 
原 , 1998). TEAT TET EIE MEI DNA Zi 
构 与 复制 转录 的 恨 好 模型 。 此 外 ,线粒体 基因 组 作 
为 一 种 分 子 标记 ,包含 多 个 进化 速率 各 异 的 基因 , 广 
泛 应 用 于 动物 界 不 同等 级 阶 元 系统 发 育 的 研究 
(Ballard, 2000; Buckley et al., 2001; Cameron et 
al., 2007) , 

JA £u mE NE Chitoria ulupi 3 | F 8 *H H 
( Lepidoptera ) , $ ESL ( Nymphalidae ) , [^] {36 tE y h 
( Apaturinae) 。 分 布 于 我 国 辽 宁 WAE V {105 浙江 、 
和 福建、 江西 .四川 云南 等 地 。 幼 虫 以 榆 科 的 珊瑚 朴 
Celtis julianae HFE. Η Bu Bl pep fe ME BS TE 
DUE I EOE SUR HE BLA ΤΙΜΗ ΙΒ (J5] 285r, 1994, 
1998) , ied JO XT IN ja ΘΕ I Zr με Aie DS] 2H E FF 21 B5) HT 
RIE- 

ΡΕ ΗΕ VS E E πι 2p 2e. Η RRP Εξ 
类 群 , 包 括 许 多 农林 业 重 要 害虫 。 该 亚 科 物种 对 环 
境 的 敏感 性 强 , 地 理 种 群 分 化 较 多 , 亚 科 的 构成 、 属 
间 和 种 间 系 统 关系 一 直 未 达成 共识 。 本 研究 以 武钢 
峡 蝶 作为 研究 对 象 , 对 其 线粒体 基因 组 全 序列 进行 
了 测定 和 分 析 ,并 与 相关 的 近 缘 物种 线粒体 基因 组 
进行 了 比较 分 析 ,以 期 为 峡 蝶 科 系 统 学 和 分 类 学 的 
人 研究 提供 分 子 生物 学 的 证 据 。 








1 材料 与 方法 


1.1 标本 的 采集 和 保存 

We θεὲ 2009 年 7 月 12 日 采 目 山西 省 中 条 山 
(34.87?N,110. 86°E 7553 910 m) ,采集 到 的 昆虫 活 
体 保存 在 -80% 冰箱 中 备用 。 
1.2 基因 组 DNA 提取 

挑选 保存 完好 的 蝴蝶 标本 , 取 其 胸部 肌肉 ,采用 
OMEGA Insect DNA Kit 试剂 盒 结 合 酚 氯仿 法 提取 样 
品 总 DNA , 抽 提 完毕 后 ,用 1.0% BEN ERE E DOR 
测 其 纯度 及 浓度 ,并 于 -20 € 保存 备 用 。 








1.3 引物 设计 及 PCR 扩 增 

参考 Simon 2006 年 发 表 的 线粒体 通用 引物 序 
列 和 目前 已 发 表 的 鲜 这 目 相 近 物 种 引物 (Hwang et 
al., 2001; Hong et al., 2009) 进行 首 轮 扩 增 。 其 他 
未 能 得 到 的 序列 通过 在 GenBenk ΠΗ FRIK Εἰ ης 
部 分 线粒体 基因 序列 进行 ClustalX( Thompson et al., 
1997 ) 对 比 寻 找 相 关 保 守 区 ,根据 引物 设计 的 基本 
原则 ( 张 新 军 和 高 燕 宁 ,2004) ,利用 引物 设计 软件 
Primer Primier( Ver. 5. 0) ( Singh et al., 1998) 设计 相 
关 引 物 。 本 实验 共用 引物 22 xp TN BERE ZE, 
粒 体 基 因 组 所 有 序列 。 

按照 引物 序列 ,采用 TaKaRa La Taq 聚合 酶 扩 
增 各 个 卢 段 ,所 有 PCR 反应 均 在 冰 上 操作 。PCR 反 
应 体系 为 25 uL, Æ 10 x LA PCR Buffer 2. 5 uL, 
dNTPs 4 uL(2.5 mmoVL) ,上 和 下游 引 物 各 1 uL (10 
umol /L) ,模板 DNA 1 uL, TaKaRa LA Taq fi 0. 25 
uL(5 U/uL) , 灭 阔 水 补足 至 25 pL。 少 数 引 物 在 进 
f; PCR 扩 增 反应 时 对 模板 DNA 和 引物 的 量 作 适当 
调整 。PCR 扩 增 条 件 为 :95Y 预 变 性 5 min;95%C 变 
性 50 s,48% 复 性 50 s,68% 延伸 2 min,30 个 循环 ; 
68^C 延伸 10 min. KH 196 AEE A ERE E Yk EM 
PCR 产物 。 
1.4 序列 测定 

目的 PCR 扩 增 产物 通过 直接 测序 法 获得 目的 
片段 信息 。 所 有 片段 均 为 双 回 测 通 ,未 能 测 通 的 序 
列 则 根据 目测 序列 再 设计 引物 ,PCR 扩 增 双 回 测序 
后 补 全 线粒体 基因 组 全 部 序列 。 
1.5 序列 的 拼接 与 注释 

得 到 所 有 序列 片段 测序 结 采 后 , 利用 
Sequencher 4. 8( Gene Codes Corporation, 2008 ) 软件 
对 所 有 序列 进行 拼接 。 线 粒 体 全 基因 组 各 基因 的 定 
位 及 注释 参考 鲜 邓 目 已 测 得 的 鲜 翅 目 昆虫 全 线粒体 
基因 组 注释 结果 (人 徐 浪 等 , 2007; Kim et al., 2009; 
Jiang et al.，2009 ) 进行 ,通过 MEGA4.0(Tamura et 
al., 2007) 比 对 以 及 Blast 在 线 搜索 分 析 相 结合 来 依 
次 注释 13 个 和 蛋白 质 编码 基因 (protein coding genes, 
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PCGs) .22 个 tRNA 基因 2 个 rRNA 基因 和 AT 丰富 
区 的 位 置 。tRNA 基因 二 级 结构 的 预测 主要 是 通过 
tRNAscan-SE 1.21 在 线 预 测 并 进行 人 工 校正 。 
1.6 系统 发 育 分 析 

基于 全 线粒体 基因 组 的 13 个 和 集 白质 编码 基因 核 
苷 酸 序列 建立 MP 树 ,研究 中 涉及 到 的 鳝 翅 目 昆虫 38 
种 ,其 中 峡 蝶 科 昆虫 12 种 ,并 选择 了 与 鲜 翅 目 关 系 较 
Ir B R HR Drosophila yakuba , ΙΧ] E, NV. TZ Ex Anopheles 
gambiae 意大利 蜜蜂 Apis mellifera ligustica 和 小 峰 能 
蜂 Bombus hypocrita 作为 外 群 。 将 38 PHERI H Eb UR 
和 4 个 外 群 线粒体 基因 组 中 的 13 个 重 日 质 编 但 基因 
序列 串联 后 ,通过 Clustalx 1. 83 软件 进行 序列 比 对 ， 
避免 移 码 。 比 对 之 后 采用 最 大 简约 法 (maximum 
parsimony method, MP) 进行 分 析 , MP 法 所 用 软件 为 
PAUP 4.0, 其 参数 如 下 :heuristic search, TBR branch 
swapping, Hj Bootstrap (1 000 replications ) 来 检验 各 
方 点 的 置信 和 度 ,使 用 的 参数 与 搜索 最 人 简约 树 相 同 。 在 
搜索 最 简约 树 时 ,所 有 位 点 被 认为 碱 基 处 理 作 Fitch 
性 状 (无 序 )。 是 具有 4 种 状态 (A,T,C,G) 的 无 序 位 
点 ,排序 中 的 裂缝 作为 缺失 处 理 。 











2 有 果 


2.1 exu mtDNA 基因 组 结构 

武 铠 峡 蝶 的 线粒体 基因 组 全 长 为 15 279 bp 
(全 序列 已 经 提交 到 GenBank ,登录 号 :KP284554， 
基因 组 成 与 典型 的 后 生动 物 线粒体 DNA 相似 
( Wolstenholme, 1992) ,包含 13 个 入 日 质 编 码 基因 
( PCGs) ,2 个 rRNA 基因 (16S rrnL 和 12S ΤΠ) 、 
22 个 tRNA 基因 及 一 个 AT 宣 售 区 (A + T-rich 
region) 。 在 线粒体 基因 组 编码 的 37 个 基因 中 ,N 
链 ( minority-strand) 编 公 了 14 个 基因 ,包括 4 个 有 重 
日 质 编码 基因 ,8 个 tRNA 基因 及 2 个 rRNA 基 
因 ; 其 他 23 A XE Dg J ΒΕ 44 fi. ras 基因 和 
tRNA “基因 之 间 391 bp 确定 为 AT 富 含 区 。 基 
因 排 列 顺序 与 其 近 缘 种 昆虫 的 基因 排列 顺序 一 
致 (Zhang et al., 2012; Chen et al., 2012; Wang 
et al., 2013) 。 其 中 trnM-trnl-trnQ 的 排列 方式 与 
假想 昆虫 祖先 的 排列 方式 trnI-trnQ-trnM 不 同 
( Boore et al., 1998) ,但 这 种 排列 方式 在 鳞 却 目 
Eb ΠΗ rp AE rg ΜΗ. 

ΡΕΜΑ Fr SEDI 2H FA 16 ARBRES] ge, dE 
111 bp ,最 长 一 处 位 于 ND5 和 ΙΒΝΑ Z [E] , EY 
列 为 56 bp; 基 因 间 隔 区 有 12 处 , 共 168 bp, tRNA™ 








和 ND4L 之 间 间 隔 最 长 为 59 pp, 其 次 是 tRNA 和 
ND2 2Η], E] pa 52 bp。 既 无 间隔 又 无 重 登 的 区 域 
共有 9 处 ( 表 1) 。 武 铠 峡 蝶 的 基因 结构 及 基因 顺序 
见 图 1 及 表 1。 









Chitoria ulupi 
15 279 bp 


图 1 AARIKE AEA E 





Fig. 1 


Gene map of the mitogenome of Chitoria ulupi 


2.2 gie EAE ZELUS A ZELTZCEE RA 

AN ge IE Zr D] 2H rn ALT, C 和 G ga dE 
tg 4] ΠΗ 38. 996 ,41. 096,12. 496 PU 7. 896 , T 含量 
最 高 而 G 含量 最 低 。A +T 含 量 为 79.9% ,C +C R 
ΞΕ 20.296, SEL EP deu 3739 个 密码 
子 , 不 包含 终止 密码 子 ,A +T REN 78.2%, 比 全 
序列 的 A +T 含 量 稍 低 。 重 日 质 编 但 基因 密码 子 第 
1 位 点 的 AT fe] TE (80. 4%) 高 于 第 2 位 点 
(76.5% ) 和 第 3 位 点 (77.7% )。22 个 tRNA 基因 
A-T 8 Ἡ 81.196 ππι, ΠΕΡΑ - T mE 
84.396 ,rrnS 基因 的 A ΤΕΕ 85. 196 ,控制 区 的 
A+T 含 量 最 高 为 90.3%( 表 2) 。 

武 铠 上 峡 蝶 线粒体 基因 组 中 存在 很 高 的 A+T 
含量 ,这 与 其 他 鲜 翅 目 昆虫 是 一 样 的 。 武 馆 峡 嵘 
线粒体 基因 组 中 A +T 含 量 与 已 知 的 儿 种 近 缘 种 
TH EG X EE κ} ELE C. ulupi( 79. 996) = 大 
Eke hE Sasakia charonda (79. 996 ) < ΜΠ Ἐξ [ΕΕ 
Apatura ilia( 80. 596) = 2Η 1Η [^] EE ΠΕ Apatura metis 
(80.596) < Ja ΕΙ Timelaea maculate( 81. 196 ) < 
HH WES Sasakia funebris( 81. 296 ) (R 3) ( 38; 
等 , 2012; Zhang et al., 2012; Chen et al., 2012; 
Wang οἱ al., 2013; iX XÆ, 2013), ^r rz 
符合 昆虫 线粒体 基因 组 中 A +T E τὰ ha e PE FIF 
fiE ( Tzeng et al., 1992; Lee and Kocher, 1995; 
Noack et al., 1996) , 
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Al uie ERI ABER 


Table 1 Organization of the mitochondrial genome of Chitoria ulupi 





基因 方 回 位 置 Xu 反 密 码 子 起 始 密码 子 终止 密码 子 基因 间 的 间隔 ” 
Gene Direction Location Size Anticodon Start codon Stop codon Intergenic length * 
tRNA Το F 1 -68 68 CAT 
tRNAT F 69 — 133 65 GAT 0 
tRNAC™ R 131 - 199 69 TTG -3 
ND2 F 252 —1 265 1 014 ATT TAA 52 
ΙΒΝΑΤΡ Ε 1 264 - 1 331 68 TCA 25 
tRNA R 1 324 - 1 385 62 GCA -8 
tRNA™ R 1 392 -1 456 65 GTA 6 
COI F 1 467 -3 002 1 536 CGA TAA 10 
ΙΒΝΑ!-(00Ὰ) Ε 2 998 -3 065 68 TAA =5 
COII F 3 066 -3 744 679 TTG T -tRNA 0 
tRNA F 3 742 -3 812 71 CTT -3 
IRNA ^ F 3 812 -3 877 66 GTC -1 
47P8 F 3 878 -4 042 165 ATC TAA 0 
47P6 F 4 036 -4 713 678 ATG TAA EX 
COIII F 4 713 -5 501 789 ATG TAA -1 
tRNA F 5 504 -5 569 66 TCC 2 
ND3 F 5 567 -5 923 357 ATA TAA -3 
tRNA F 5 93] - 5 995 65 TGC 7 
tRNA F 5 995 -6 058 64 TCG -1 
tRNA F 6 065 — 6 130 66 GTT 6 
tRNASeCAGN) F 6 129 -6 189 61 GCT =2 
tRNAC™ F 6 192 -6 256 65 TTC 2 
tRNAPe R 6 255 -6 321 67 GAA 22 
NDS R 6 266 — 8 056 1 791 ATC TAA - 56 
tRNA" R 8 054 -8 121 68 GTG -3 
ND4 R 8 122 -9 460 1 339 ATG T -tRNA 0 
ΝΡΗΙ, R 9 460 —9 744 285 ATG TAA -1 
tRNAT* F 9 804 —9 868 65 TGT 59 
tRNA R 9 869 -9 932 64 TGG 0 
ND6 F 9 935 — 10 462 528 ATT TAA 2 
CytB F 10 467 - 11 618 1 152 ATG TAA 4 
ΕΝΑ ο F 11 617 - 11 683 67 TGA = 
ΝΡΙ R 11 701 -12 639 939 ATG TAA 17 
tRNA CUN) R 12 641 - 12 714 74 TAG 1 
rrnL R 12 715 - 14 048 1 334 0 
tRNA R 14 049 -14 112 64 TAC 0 
rrnS R 14 113 — 14 888 776 0 
控制 区 Control region 14 889 -15 279 391 0 




















基因 间 的 间隔 一 列 中 , 正 数 表示 基因 间 隅 碱 基数 ,负数 表示 基因 重 堆 碱 基数 。TIn the column of intergenic length the positive number indicates 


interval base pairs between genes while the overlapping base between genes. 
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Table2 Nucleotide composition of the mitochondrial genome of Chitoria ulupi 











大 小 Size ( bp) A% T% G% C% (A+T)% (G+C)% 
全 基因 组 mtDNA 15 279 38.9 41.0 7.8 12.4 79.9 20.2 
借 和 白质 编码 基因 PCGs 11 252 33.2 45.0 11.2 10.6 78.2 21.8 
密码 子 第 1 位 点 151 codon site 3 739 34.9 45.5 10.1 9.4 80.4 19.5 
密码 子 第 2 位 点 2nd codon site 3 739 33.7 42.8 1252 11.3 76.5 23.5 
密码 子 第 3 位 点 3rd codon site 3 739 31.0 46.7 11.1 11.1 71.17 22.2 
tRNA ] 469 41.5 39.6 10.8 8.2 81.1 19.0 
rrnL ] 334 45.5 38.8 10.6 5.0 84.3 15.6 
rrnS 776 44.6 40. 5 10. 1 4.9 85.1 15.0 
控制 区 Control region 391 42.7 47. 6 3.8 5.9 90.3 9.7 
RI ΒΕΛΗ BORED RE 6 种 近 缘 种 线粒体 基因 组 的 碱 基 组 成 
Table 3  Mitogenomic nucleotide compositions of the 6 closely related species of the Apaturinae 
mtDNA 蛋白 质 编码 基 imb mS A CTzERIX 
密码 子 个 数 ” 因 A +T 含 量 ， ,;ῳ2 
物种 Species 大 小 Number of Α ΕΤ 大 小 (A & T) 大 小 (A & T) 大 小 (A+T) πλαν 
Size C A - T) 9o codons” content Size o Size " Size φῇ odd em 
( bp) (96) in PCG? (bp) ( bp) ( bp) 
Chitoria ulupi 15 279 79.9 3 739 78.2 ] 334 84.3 776 85.1 391 90.3 KP284554 
Sasakia charonda 15 233 79.9 3 732 78.4 ] 330 84.0 776 84.0 381 91.6 JX119051 
Apatura ilia 15 242 80.5 3 711 78.9 ] 333 86.0 776 84.0 403 92.5 | NC 016062 
Apatura metis 15 236 80.5 3 717 78.9 ] 333 84.5 779 84.8 304 92.9 NC 015537 
Timelaea maculata 15178 81.1 3 734 79.7 1 332 85.0 TTI 85.9 382 93.2 Να 021090 
Sasakia funebris 15 233 81.2 3 736 80.0 ] 333 84.6 772 85.5 370 93.0 | NC 022134 











在 总 的 密码 子 计 算 中 没有 包括 终止 密码 子 Termination codons were excluded in total codon count; ?蛋白 质 编 码 基因 Protein coding genes. 
8 8 


2.3 武 铠 峡 蝶 线 粒 体 基 因 组 蛋白 质 编码 基因 

武 馆 峡 蝶 线 粒 体 基因 组 含 13 个 蛋白 质 编 码 基 
因 , 其 中 ND2 和 ND6 以 ATT 作为 起 始 密 人 码 子 ， 
ATP6 , COII , NDA , NDAL , CytB 和 ND1 以 ATG 作为 
起 始 密码 子 ,47P8 和 NDS 以 ATC 作为 起 始 密码 子 ， 
ND3 以 ATA 作为 起 始 密码 子 ,CO7 以 TTG. 作为 起 
始 密码 子 ,CO1 CGA 作为 起 始 密码 子 。 而 在 其 他 
5 种 近 缘 种 中 ,CO1 均 以 ATG ENERET, 
47P8 和 ND5 35] VA ATT EAR i Γι IS DA] E 
WE COM 以 ATA EWER RT 3Η ns DA] ied VD3 
VI ATT ENER ΠΗΓΗ ND4L 以 ATA 作 
ΙΑ R3 ΓΣΕΕ BEES DAI Oe ΒΕ. zr D^] Hoe μξ 
Ti BA Ee dc dt y ND6 以 ATA 作为 起 始 密 码 子 , 猫 峡 
ΜΕ} ATC 作为 起 始 密码 子 ( 表 4) 。 

终止 密码 子 有 以 TAA 或 TAG 标准 密码 子 作为 
终 目 密码 子 ,也 有 以 单独 的 T 作 为 终止 密码 子 的 重 
白质 编码 基因 ,CO 和 ND4 以 单独 的 T 作 为 终止 密 
码 子 ,ND2 , COI , ATP8 , ATP6 , COIII , ND3 , ND5 , ND4L, 
ND6 , CytB 和 ND1 DJ TAA 作为 终止 密码 子 ( 表 4) 。 

全 部 重 日 质 编码 基因 的 密码 子 和 氨基 酸 使 用 情 








况 的 统计 分 析 显 示 , 使 用 最 频繁 的 氨基 酸 为 Leu, 
Ile, Phe 和 Met, 使 用 最 频繁 的 密码 子 为 TTA, ATT, 
TIT 和 ATA ,反映 了 核 苷 酸 组 成 的 AT did TES XT 
于 检测 到 的 tRNA 基因 ,使 用 最 频繁 的 氨基 酸 并 不 
总 是 与 tRNA 的 反 密 人 码 子 对 应 的 。 

2.4 ” 武 铠 峡 蝶 线粒体 基因 组 tRNA 基因 和 TRNA 基因 

根据 tRNAScan-SE 预测 结果 ,并 辅助 人 工 校 下 
的 方法 预测 出 武 能 峡 蝶 线粒体 的 22 个 tRNA 结构 。 
m ΙΕ ΜῈ 22 个 线粒体 tRNA 中 , ER ORNA ^" ΛΙ 
tRNA“ 所 对 应 的 tRNA 有 2 个 以 外 ,其 他 的 氨基 酸 
都 只 有 1 个 tRNA 与 之 对 应 。 除 了 tRNA 缺少 
DHU 臂 外 ,其 余 21 个 tRNA 均 可 形成 典型 的 三 叶 草 
结构 (图 2)。 

IN Fo BE ZX dr ΡΙ2Η η 22 个 tRNA 基因 的 
排列 顺序 与 其 近 缘 种 昆虫 的 相同 ,基因 长 度 在 61 ~ 
79 bp 之 间 。 每 种 tRNA 的 反 密 码 子 都 与 已 知 鳞 却 
H BEBE ELD$RRCE. autonoe ἯΙ A. issoria ) 的 反 密 但 子 
相同 (Hu et al., 2010; Kim οἱ al., 2010). tRNA 的 
— SR T t, E ἈΠΘΕ ΝΕΤ ΒΤ ΤΠΕ ΠΕ RA , IURE LAS 
与 许多 后 生动 物 相 一 致 ( 张 方 和 米 志 男 ,，1998; Hong 
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[η ΒΚ “κ Τὶ 6 种 近 缘 种 的 起 始 密码 子 和 终止 密码 子 的 使 用 情况 


Table 4 Start and stop codon usages of the 6 closely related species of the Apaturinae 


CAMO oN ONO ON dn 
基因 起 始 终止 起 始 终止 起 始 终止 起 始 终止 起 始 终止 起 始 终止 
co. BBT ”密码 子 ”密码 子 ABT ”密码 子 ABT ”密码 子 WBT WBT SBT ΘΓ ”密码 子 

Start Stop Start Stop Start Stop Start Stop Start Stop Start Stop 

codon codon codon codon codon codon codon codon codon codon codon codon 
ND2 ATT TAA ATT TAA ATT TAA ATT TAA ATT TAA ATT TAA 

COI CGA TAA CGA TAA CGA TAA CGA TAA CGA TAA CGA TAA 

COIT TTG T ATG T ATG T ATG T ATG T ATG T 
ΑΤΡ8 ATC TAA ATT TAA ATT TAA ATT TAA ATT TAA ATT TAA 
ATP6 ATG TAA ATG TAA ATG TAA ATG TAG ATG TAA ATG TAA 
COII ATG TAA ATG TAA ATG TAA ATA TAA ATG TAA ATG TAA 
ND3 ATA TAA ATA TAG ATA TAA ATA T ATT TAG ATA TAG 
ND5 ATC TAA ATT TAA ATT TAA ATT T ATT T ATT TAA 
NDA ATG T ATG T ATG T ATG T ATG T ATG T 
ND4L ATG TAA ATG TAA ATA TAA ATG TAG ATG TAA ATG TAA 
ND6 ATT TAA ATA TAA ATA TAA ATA TAA ATA TAA ATC TAA 
CytB ATG TAA ATG TAA ATG TAA ATG TAA ATG TAA ATG TAA 
ΝΡΙ ATG TAA ATG TAA ATG TAG ATG TAA ATG TAA ATG TAA 


et al., 2009; Liao et αἰ.. 2010) 。 

在 所 预测 的 22 种 tRNA 二 级 结构 中 总 共 出 现 
了 21 对 碱 基 错 配 ,其 中 有 20 对 为 GU 错 配 ,其 余 1 
对 为 AA 错 配 。AA 错 配 发 生 在 tRNA“ 的 T+C T 
上 (图 2)。 大 紫 峡 蝶 、 黑 紫 峡 嵘 、 猫 峡 蝶 、 细 带 闪 峡 
BE RUD NEERA tRNA 二 级 结构 均 含 有 G =U,U 
= U 非 经 典 配 对 ,这 种 错 配 现象 在 钱 翅 目 之 外 的 许 
多 昆虫 类 群 中 也 有 发 现 (Bae et al., 2004) , 

rRNA 基因 是 线粒体 基因 组 中 进化 最 慢 、 最 为 
保守 的 基因 , 仅 根据 核 苷 酸 序列 无 法 精确 定位 rRNA 
基因 的 起 始 位 置 ,因此 通 篆 被 认为 伸 达 两 侧 基 因 的 
边界 (Boore，2006 ) ο rrn$ 在 基因 组 中 的 位 置 位 于 
tRNA 和 控制 区 之 间 , πη, 位 于 tRNA" 和 
tRNA 25 1], AES BEBE IA rrnL 和 rms 长 度 分 别 是 
1 334 bp 和 776 bp, AT 含量 分 别 为 84. 396 和 
85.196 , JN ge BERE ΠῚ rrnL 长 度 与 儿 个 近 缘 种 相 比 
25335 dz, p: ES ες 1 333 bp, 47r pA] Sc SE 
1 333 bp, JJ EE [x] IERE 1 333 bp, ΛΕΜΕ 1 332 bp 和 
KAER 1 330 bp ,相差 1 «4 bp。rrns 长 度 差 别 也 
AK UON nts AJ EE 779 bp, A ες 777 bp ,大 
AR ΒΕ με ΤΠ SR AE 776 bp, ZR WE 772 bp, 相 差 
2 ~7 bp。( 表 3)。 
2.5 ΤΟΜΕΑ AH A TeK 

线粒体 基因 组 AT 宣 含 区 为 线粒体 基因 组 主要 
的 非 编 码 区 , 武 包 峡 蝶 A +T EE DOT rms 基因 
和 tRNA “基因 之 间 , 长 度 为 391 bp, A € T EEN 














90.396, JLZ VI PR A +T HA KRKE 
κ, WH : ΙΕΡΗ ΦΕΚ (403 bp) > 4H rir [^] Sc E 
(394 bp) > iia BENE > JE ΕΒΕ (382 bp) > RE 
WE(381 bp) > ZR SE BENE (370 bp) ,相差 11 ~ 33bp; 
A T S Æ D] Τι 1 E ZR Esc II {ΚΚ ὑς Ἢ Ai ΒΕ 
WE(03.296) > IR ERE NE (93. 0%) > 3} mir pA] ΝΕ 
IR (92.9% ) > KE ERE (91. 690) > ΑΤΗΚ (σε 
3)c 

在 ππς 基因 的 下 游 有 一 段 由 ATAGAA 引导 的 
保守 的 长 度 为 21 bp 的 多 聚 工 结构。 此 外 ,在 武钢 
峡 风 线粒体 A+T 军 含 区 中 存在 2 段 长 度 为 35 bp 
的 重复 单元 ,其 重复 序列 之 间 的 间隔 为 0。 并 且 与 
Fb 88 H Eb TR E BEP TE (AT), 结构 。 在 重复 
序列 上 游 存 在 10 bp HZR A 结构 (图 3)。 
2.6 iie UE ZR ZR ALB A 

VAS D. yakuba X) EE MV. T£ Ex: A. gambiae | ἘΞ 
KA| K A. mellifera ligustica 和 小 峰 能 蜂 B. 
hypocrita 作为 外 群 , 基于 38 PIREA H WP ERA 
基因 组 的 13 个 和 蛋 日 质 编码 基因 核 并 酸 序列 建立 MP 
Wo ZR oS (ΕΙ 4) 总 科 级 别 的 系统 发 育 关系 为 : 
卷 蛾 总 科 Tortricoidea + ( ΜΕ I3 fL Papilionoidea + 
(ή ESL Pyraloidea + (X B APh Noctuoidea + 在 
峨 总 科 Bombycoidea + RIR AP Geometroidea) ) ) ο 

所 分 析 的 38 种 鲜 翅 目 昆 虫 基本 分 为 3 个 大 
RRIK: GIR AP E N REL (Tortricidae ) 的 3 个 
种 类 聚 在 一 起 ,构成 第 1 REHE s KER ARH ERE 














3 期 


Alanine 
(A) 


Glutamine 


(Q) 


cccPpcCcPc 


Leucine 
(L1,UUR) 


Proline 


(P) 


CCOCCCO 


C »-C 


OP »-c 


Tyrosine 
(Y) 


ΠΩΣ 
CCCC»CC» 


rrnS-14 888 bp 


ῬΡΡῬΟΡΟΡΣῬ 


0-0 
-GC 


»-C 
» 








ERPE: up BOREAS HS RE DS 2H ΑΗ 9 JU πε RAT T 
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4G 
A 
(R) xn (N) U-A 
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CS MN PM UNT 
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ο ONE e E 
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X ο υ uU 
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G+U 3 
U+G G-c 
U A υ-Α 
Cc A 
S MNA. 
AG CUU 
Serine U Serine 
G-C 
(SI, AGN) A-0 (S2,UCN) U 
A A-U 
A-U 
υ--Α A-U 
T. U UA 
8 υ - 
AUAAUUACU A A-U 
ὑλδύδ, ue ται 
A Ac Ay U GUA UcuuyaY u 
G Uyu U A i 
ii UCG AGA AU 
A U 1111 A AU 
AA A 
^ ου" ^U A G 
AU-A U-A^ 
U-A U-U 
A-U U-U 
G C G-C 
s G ο Αι 
υ 
ο p “ο 
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Valine 
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c-G 
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η ——— Amino acid acceptor (AA) arm 
υ--Α 
A-U υ 
G UAR 
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US uuce AAA 
113 e^ 
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U-A 
U—-A 
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U SU 
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(D) 
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图 2 guit tRNA 的 二 级 结构 
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Cysteine 
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Ῥ 
Σπ 
Ῥσσοσον 
τιιι-ειι 
C»»000cc 
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Fig. 2 Secondary structures for tRNA genes from Chitoria ulupi mtDNA 


ATTATCACTATTTTTCACATAGATTTTTTTTTTTTTTTTTTTTTATATTAAATGTATAATA 





€i AS] 
Poly-A element 


35 bp 的 重复 单元 


35 bp repeat element 


GIATGCATACATATATGTACATTAAATTAACAAAAACTATTTATTTATATAGTTTATTAA 


TE DERE AG Eie 


Origin of light strand replication 
GACATTAATAAATTTTTATTATTTATTCTTICTCTTTTTTCATAATATTGTTATTAAAAA 


TTAATATCAATATAAGTTGTATATTA ATCCAATTAA ATAACA ATA AATTA ATAA AATTA 
TAATTAATTTAAAAAAAAAADTAAT ΑΤΑΤΝΝΙ 


7 


ACCATTTITAATAATTTTTACATAAAAGAA 1527 


35 bp 的 重复 单元 ， 


35 bp repeat element 
TAATATATATATATATATAC ATGTGTGTGC 
1 H.E (AT)n 单元 


Macrosatellite (AT)n element- 


9 bp-- ERN. AME 


图 3 VUES AT 亩 含 区 结构 


Fig. 3 Structure of the A + T-rich region of the mitochondrial genome of Chitoria ulupi 
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Pieris melete 
Pieris rapae 
Spindasis takanonis 
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Kallima inachus 
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图 4 基于 38 RES HE SAIS 13 个 重 日 质 编 码 基 因 核 音 酸 序列 的 最 大 简约 树 
Fig. 4 Maximum parsimonious phylogenetic tree of 38 lepidopteran species based on the nucleotides of 13 protein coding genes 


分 支 节点 的 数值 表示 自 引 导 值 。Bootstrap support values are indicated at each node. 





( Pieridae) 5j JK WEE ( Lycaenidae ) 的 种 类 先 聚 , 表 与 
CERE Nymphalidae ) ft) ο. νι 
( Papilionidae ) 的 种 类 聚 在 一 起 ,构成 第 2 RANE; A 
Roa PA AK πὲ ΤΕ ( Sphingidae ), Æ ^ Rr 
( Bombycidae ) , X Æ IRE} ( Saturniidae ) 和 尺 蛾 总 科 
的 下 蛾 科 (Geometridae) 的 种 类 先 肾 在 一 起 ,再 与 夜 

峨 总 科 夜 蛾 科 ( Noctuidae ) 、 灯 蛾 科 ( Arctiidae ) , gg gk 
fl ( Lymantriidae ) MAHIR E} ( Notodontidae ) 的 种 类 相 
ΒΚ πχ ἡ HEURES ECCE Crambidae ) 的 种 类 聚 
在 一 起 ,形成 第 3 聚 类 徐 。 总 科 内 各 科 及 科 内 各 物 











CRS 





种 优先 以 很 高 的 置信 度 
WERE 12 个 物种 又 分 为 2 FINIS ,第 
ΠΣ Acraea issoria + ( S fii ΡΕ Fabriciana jii. 


SERERE ,然后 再 与 其 


+ 3ΕΦΝΙΡΕΕ Areynnis hyperbius) ) + ( 仁 pn Eumenis 


autonoe FUR ZH NE Calinaga ο 
edm Sasakia charonda + ΠΕ E 
funebris) + ( 217} [1] EE HE Apatura metis + T A 
WE Apatura ilia) ) + (2 WE WE Timelaea maculata + 
jio ΙΕ ME Chioria ulupi)) + f IF mk ΠΕ Kallima 


inachus 。 


ffe a 次 为 ， . 
IE Sasakia 
$ [^] ie 
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Tra a BC Zr A 2H ΠΠ, Æ COT 基因 起 始 
区 及 紧邻 前 面 tRNA “基因 的 区 域 都 没有 发 现 标 准 
的 ATN 起 始 密码 子 , 这 种 现象 在 其 他 近 缘 种 中 同样 
存在 。 我 们 将 武 忽 峡 蝶 和 所 有 目前 已 知 蝶 类 COI 
基因 起 始 区 附近 的 序列 进行 了 比 对 ,参照 其 近 缘 种 
推定 CGA 作为 COI 的 起 始 密码 和 于。 武钢 峡 屿 线 粒 
体 基因 组 中 的 COM 以 TTG 作为 起 始 密码 子 ,47P8 
和 NDS 以 ATC 作为 起 始 密码 子 。 而 在 其 他 5 种 近 
绿 种 中 ,CO1 均 以 ATG 作为 起 始 密码 子 ,47P8 和 
ND5 Βλ ATT 作为 起 始 密 人 码 子 。 在 终止 密码 子 上 ， 
起 能 峡 暴 与 其 他 5 种 近 缘 种 均 有 不 同 之 处 :大 紫 峡 
WE RU ME ND3 以 TAG EWA IE 25 R3 T ; RR θὲ 
WE ΝΡΙ VJ TAG WAIE; Air D] ce ND3 以 
TAG,NDS5 VL RS T FEIER LESS T^ STAR DATES 
ATP6 和 NDA4L VA TAG, ΝΠ3 和 NDS 以 单独 的 工作 
为 终止 密码 子 ( 王 菊 平 等 , 2012 ; Zhang et al., 2012; 
Chen et al., 2012; Wang et al., 2013; "iX, 
2013 ) 。 从 起 始 密 码 子 和 终止 密码 子 的 使 用 情况 可 
以 看 出 , 武 馆 峡 蝶 与 猫 峡 暴 、 大 系 峡 暴 的 同 源 性 较 
高 , 黑 紫 峡 蝶 和 细 带 内 峡 嵘 居中 ,与 柳 紫 内 峡 嵘 的 同 
源 性 则 较 低 。 同 时 也 再 一 次 验证 了 昆虫 线粒体 基因 
组 中 A +T REAL IRL PE BR RE TE ο 

鲜 翅 目 昆虫 线粒体 基因 组 AT 定 含 区 比 大 多 数 
ATAGAA 引导 的 保守 的 长 度 为 21 bp HZR T Zi 
构 。 其 余 5 种 近 缘 物种 的 AT ἘΓΏ ΙΧ ΤΕ ἘΚ 
的 多 聚 工 结构 ,其 中 柳 紫 闪 峡 蝶 中 存在 的 多 聚 工 结 
FI BE Ej a pe ΘΕ ΒΕΛΗ [8] ,为 21 bp, Hri IKER  oe 
φας ου θὲ. ο ο FEWER T RK 
度 均 为 19 bp, ΗΝ, ΤΕΛΙΚΑ A +T HA 
区 中 存在 2 BEI BEDS 35 bp 的 重复 单元 ,其 重复 序 
列 之 间 的 间隔 为 0。 并 且 与 其 他 鲜 翅 目 昆 虫 比较 也 
存在 (AT), 结构 。 在 重复 序列 上 游 存 在 10 bp 的 多 
R A 结构 (图 3)。 同 样 地 ,大 紫 峡 暴 中 存在 2 段 长 
度 为 17 bp 的 重复 单元 1 个 (AT)s 结构 及 1 个 10 
bp 的 多 聚 A 结构 ; lits D^ CE rte dE 2 段 长 度 为 27 
bp 的 重复 单元 1 A CAT) i 结构 及 1 个 9 bp 的 多 聚 
A 结构 ; 猫 峡 蝶 存在 2 段 长 度 为 15 bp 的 重复 单元 
及 1 个 (AT); 结构 1 个 (AT)s 结构 及 1 个 9 bp 的 
ANE A 结构 ; 黑 紫 峡 蝶 中 存在 2 段 长 度 分 别 为 18 
bp 的 重复 单元 和 14 bp 的 重复 单元 及 1 I CAT), 结 
构 ; 柳 此 内 峡 蝶 中 存在 1 个 (AT); 结构 、1 A CAT) o 





























结构 及 1 个 14 bp HJ ZEE A 结构 。 
基于 线粒体 基因 组 全 序列 的 MP 系统 发 育 分 析 
ZAR ade BOUE ΠΗ, 5 种 近 缘 种 的 系统 进化 关系 
JJ: CCCR AE BE HE Sasakia charonda + Ze quz gue 
Sasakia funebris) + (21/1 IEEE Apatura metis + Mp ER 
[ΡΕ Apatura ilia) ) + (JH EERE Timelaea maculata 
Tg ΠΕ ΠΕ Chitoria ulupi) ) 4 ΠΒ, 8 da Εν 
C. ulupi 5 KR XE ΕΠΕ S. charonda, Œ ὃς {ΒΕ ΠΕ S. 
funebris 211 1Η NEER A. metis Mp EE D] meme A. ilia 和 
ΣΕΝ T. maculata HJ RARR der , Ἠ η, αν je Bc 
WE C. ulupi Ai SE T. maculata 关系 最 近 。 这 一 
2h AR TESI EA) SE IR AES — 81 
mtDNA 作为 一 种 重要 的 母性 遗传 标记 被 广泛 
应 用 于 进化 研究 中 ,对 种 群 结构 和 基因 流 、 洒 交 、 生 
物 地 理学 和 系统 发 育 关 系 的 研究 部 有 很 重要 的 意义 
( Avise et al., 1987; Boore, 1999; Saccone et al., 
1999). KIRAT 053} Η HUBIESE EE rh EN pai EE ZR 
体 基 因 组 全 序列 进行 了 测定 并 对 其 线粒体 基因 组 进 
行 了 注释 和 分 析 ,为 武 铠 峡 虹 分子 进 化 和 分 子 鉴 定 
研究 提供 了 科学 的 依据 ,同时 也 为 鲜 翅 目 昆 虫 系统 
发 育 提 供 了 基础 资料 ,丰富 了 鳝 翅 目 昆虫 全 线粒体 
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